FM Towns: Free Software Collection 10

home *** CD-ROM | disk | FTP | other *** search

/ FM Towns: Free Software Collection 10 / FM Towns Free Software Collection 10.iso / ms_dos / tool / mercury / patternm.c < prev next >

Wrap

Text File | 1995-01-06 | 4KB | 116 lines

/* MercuryInstaller for MS-DOS 文字列照合ルーチン */ #include<ctype.h> #include<farstr.h> #include<jctype.h> #include<jstring.h> #include"mercury.h" /*------------------------------グローバル変数-------------------------------*/ static char Scanpattern[128] = ""; /*-----------------------------全角文字の半角化------------------------------*/ /* 　標準のhantozenと違い、カタカナ・ひらがなに完全対応。 */ /* 　なお、変換結果が2バイト(変換不可能な文字、(半)濁点のついた文字)になる場 */ /* 合は、そのデータをbig endianで詰めて返す。 */ /*---------------------------------------------------------------------------*/ /* 全角文字の内部表現がシフトJISでない場合は(L'ｃ'が使えれば無変更でEUC対応に*/ /* できるのに(;_;))書き直すこと。 */ /*---------------------------------------------------------------------------*/ #define KATA_HANTOZEN(c) Kanatbl[(c)-0x8340] #define A(c) ((unsigned char)(c)) #define B(c) ( ((c)<<8) + (unsigned char)'ﾞ' ) #define C(c) ( ((c)<<8) + (unsigned char)'ﾟ' ) static unsigned short Kanatbl[] = { A('ｧ'),A('ｱ'),A('ｨ'),A('ｲ'),A('ｩ'),A('ｳ'),A('ｪ'),A('ｴ'), A('ｫ'),A('ｵ'),A('ｶ'),B('ｶ'),A('ｷ'),B('ｷ'),A('ｸ'),B('ｸ'), A('ｹ'),B('ｹ'),A('ｺ'),B('ｺ'),A('ｻ'),B('ｻ'),A('ｼ'),B('ｼ'), A('ｽ'),B('ｽ'),A('ｾ'),B('ｾ'),A('ｿ'),B('ｿ'),A('ﾀ'),B('ﾀ'), A('ﾁ'),B('ﾁ'),A('ｯ'),A('ﾂ'),B('ﾂ'),A('ﾃ'),B('ﾃ'),A('ﾄ'), B('ﾄ'),A('ﾅ'),A('ﾆ'),A('ﾇ'),A('ﾈ'),A('ﾉ'),A('ﾊ'),B('ﾊ'), C('ﾊ'),A('ﾋ'),B('ﾋ'),C('ﾋ'),A('ﾌ'),B('ﾌ'),C('ﾌ'),A('ﾍ'), B('ﾍ'),C('ﾍ'),A('ﾎ'),B('ﾎ'),C('ﾎ'),A('ﾏ'),A('ﾐ'),0x007f, A('ﾑ'),A('ﾒ'),A('ﾓ'),A('ｬ'),A('ﾔ'),A('ｭ'),A('ﾕ'),A('ｮ'), A('ﾖ'),A('ﾗ'),A('ﾘ'),A('ﾙ'),A('ﾚ'),A('ﾛ'),0x838e,A('ﾜ'), 0x8390,0x8391,A('ｦ'),A('ﾝ'),0x8394,0x8395,0x8396 }; static unsigned short ds_zentohan(unsigned short c) { if (jishira(c)) c = jtokata(c); if (jiskata(c)) c = KATA_HANTOZEN(c); else switch(c) { case 0x8175: c = (unsigned char)'｢'; break; case 0x8176: c = (unsigned char)'｣'; break; case 0x8141: c = (unsigned char)'､'; break; case 0x8142: c = (unsigned char)'｡'; break; case 0x8145: c = (unsigned char)'･'; break; case 0x814a: c = (unsigned char)'ﾞ'; break; case 0x814b: c = (unsigned char)'ﾟ'; break; default: c = zentohan(c); break; } return c; } /*-----------------------------文字列の「正規化」----------------------------*/ /* ○ひらがなはカタカナにする */ /* ○半角化できる全角文字は半角化する */ /* ○英小文字は大文字にする */ /*---------------------------------------------------------------------------*/ /* なお、Dataからsrcを引っ張ってくることを考えて、srcはfarポインタ。 */ /*---------------------------------------------------------------------------*/ extern void normalize_string(char *dst,char far *src) { unsigned short c; while ((c=*src++)!='\0') { if (iskanji(c)) c = ds_zentohan((c<<8) + *src++); if (c>>8) { *dst++ = c>>8; *dst++ = c; } else *dst++ = toupper(c); } *dst = '\0'; } /*----------------------------パターンマッチの準備---------------------------*/ /* gnu regexで置き換える場合はこれはオートマトン生成関数になる */ /*---------------------------------------------------------------------------*/ extern void patternmatch_init(char *s) { normalize_string(Scanpattern,s); } /*---------------------------------照合--------------------------------------*/ extern int patternmatch(char far *s) { char buf[128]; if (Scanpattern[0]=='\0') return 1; normalize_string(buf,s); if (jstrstr(buf,Scanpattern)!=NULL) return 1; else return 0; } /*--------------------------End of patternmatch.c----------------------------*/